Otkrivanje znanja u medicinskim domenama

Naziv kolegija

Otkrivanje znanja u medicinskim domenama

ECTS

4.5

Status

Izborni kolegij

Izvedba nastave

P6/S14/V10

Izvođači kolegija

dr. sc. Dragan Gamberger, Nastavnik
prof. dr. sc. Zdenko Sonicki, Nastavnik

Studiji na kojima se izvodi

BIOMEDICINA I ZDRAVSTVO

Kompetencije i ishodi učenja

Općeniti pristup analizi podataka i upoznavanje sa postupcima pripreme i transformacije podataka. Korištenje alata za strojno učenje. Generiranje prediktivnih modela, otkrivanje izuzetaka u podacima. Interpretacija rezultata kao novog medicinskog znanja. Korištenje rezultata u znanstvenim radovima i kao hipoteze za buduća istraživanja.


Osposobljenost za samostalnu analizu podataka koji su sakupljeni u ciljanim medicinskim istraživanjima i u redovnoj medicinskoj praksi.


Sadržaj

Dubinska analiza podataka i njen odnos prema statističkim postupcima. Inteligentna analiza podataka koja primjenjuje strojno učenje za otkrivanje novog znanja. Sakupljanje podataka i definiranje cilja otkrivanja znanja. Alati za izvođenje postupaka strojnog učenja posebno prikladni za otkrivanje znanja. Ilustrativni primjer. Priprema podataka i razumijevanje vrsta atributa. Postupanje sa nepoznatim vrijednostima i vrijednostima koje su rezultat nabrajanja. Mogućnosti i način korištenja poslužitelja za analizu podataka. Definicija klasifikacijskog problema i formalizacija oblika podataka. Internet sučelje za unos podataka i dobivanje rezultata. Parametri procesa indukcije. Razumijevanje dobivenih modela i popisa izuzetaka. Greške u pripremi podataka. Interpretacija rezultata, formuliranje znanja, statistička provjera rezultata. Interpretacija značenja atributa i skrivenih veza među atributima. Interpretacija prividnih kontradikcija, interpretacija niza pravila i dobivenih graničnih vrijednosti. Postupci indukcije stabla odlučivanja i otkrivane čestih uzoraka. Korištenje Weka sustava i RapidMiner okruženja. Vježbe: Praktični rad na stvarnim medicinskim znanstveno-istraživačkim problemima s naglaskom na odabiru podataka i transformaciji podataka, indukciji modela te njihovoj medicinskoj interpretaciji. Korištenje više različitih sustava otkrivanja znanja i usporedna analiza rezultata. Izrada seminarskog rada: Studenti sami pronalaze podatke iz svog područja interesa te ih uz pomoć voditelja pripremaju za analizu, zajednički izvode postupke analize te u kontekstu postojećeg medicinskog znanja, interpretiraju rezultate. Odabrani znanstveni članak „Gamberger, D., Lavrač, N. Expert-guided subgroup discovery: Methodology and Application. Journal of Artificial Intelligence Research 2002; 17:501-527”. Rad prikazuje postupak interpretacije rezultata dobivenih strojnim učenjem s ciljem formiranja novog znanja i otkrivanjem zanimljivih smjernica za buduća istraživanja. Rad ne prikazuje način pripreme podataka te analizu izuzetaka koji su uključeni u ovaj predmet.


Literatura

  • Gamberger D. Otkrivanje znanja dubinskom analizom podataka. Priručnik za istraživače i studente  http://lis.irb.hr/Prirucnik/prirucnik-otkrivanje-znanja.pdf
  • Data mining and knowledge discovery. Springer (journal).
  • Journal of biomedical informatics. Elsevier.
  • Intelligent data analysis. IOS Press (journal).
  • Witten IH, Frank E, Hall MA. Data Mining: Practical Machine Learning Tools and Techniques. Amsterdam: Elsevier, Third Edition; 2011.
  • Liu H, Motoda H. Computational methods of feature selection. Boca Raton, USA: CRC Press; 2007.
  • Fuernkranz J, Gamberger D, Lavrac N. Foundations of Rule Learning. Heidelberg: Springer Verlag; 2012.
  • Rokach L, Maimon O. Data Mining with decision trees. Singapore: World Scientific Publishing. 2008.
  • Berhold MR, Hand DJ. Intelligent data analysis. Heidelberg: Springer Verlag; 2007.
  • Berhold MR, Borgelt C, Hoeppner F, Klawonn F. Guide to intelligent data analysis. Heidelberg: Springer Verlag; 2010.

Oblici nastave

Predavanja i seminari na kojima se podučavaju svi ključni dijelovi procesa pripreme podataka, analize podataka i interpretacije rezultata. Za ilustraciju se koriste realni skupovi medicinskih podataka. Na vježbama polaznici (studenti) sami provode analizu podataka uz pomoć voditelja ili suradnika u nastavi. Preporučeno je korištenje vlastitih podataka studenata koje su sakupili za potrebe doktorskog studija.


Način provjere

Samostalna izrada seminarskog rada u kojem polaznik prikazuje na konkretnom primjeru kako je riješio sve dijelove procesa analize podataka. Preporučljivo je da su podaci vezani na temu doktorskog rada. Na usmenom dijelu ispita se diskutira seminarski rad, te provjerava poznavanje osnovnih elemenata procesa otkrivanja znanja.


Plan